انتخاب اعضای ترکیب در خوشه‌بندی ترکیبی با استفاده از رأی‌گیری

Authors

Abstract:

Clustering is the process of division of a dataset into subsets that are called clusters, so that objects within a cluster are similar to each other and different from objects of the other clusters. So far, a lot of algorithms in different approaches have been created for the clustering. An effective choice (can combine) two or more of these algorithms for solving the clustering problem. Ensemble clustering combines results of existing clusterings to achieve better performance and higher accuracy. Instead of combining all of existing clusterings, recent decade researchers show, if only a set of clusterings is selected  based on quality and diversity, the result of ensemble clustering would be more accurate. This paper proposes a new method for ensemble clustering based on quality and diversity. For this purpose, firstly first we need a lot of different base clusterings to combine them. Different base clusterings are generated by k-means algorithm with random k in each execution. After the generation of base clusterings, they are put into different groups according to their similarities using a new grouping method. So that clusterings which are similar to each other are put together in one group. In this step, we use normalized mutual information (NMI) or adjusted rand index (ARI) for computing similarities and dissimilarities between the base clustering. Then from each group, a best qualified clustering is selected via a voting based method. In this method, Cluster-validity-indices were used to measure the quality of clustering. So that all members of the group are evaluated by the Cluster-validity-indices. In each group, clustering that optimizes the most number of Cluster-validity-indices is selected.  Finally, consensus functions combine all selected clustering. Consensus function is an algorithm for combining existing clusterings to produce final clusters. In this paper, three consensus functions including CSPA, MCLA, and HGPA have used for combining clustering. To evaluate proposed method, real datasets from UCI repository have used. In experiment section, the proposed method is compared with the well-known and powerful existing methods. Experimental results demonstrate that proposed algorithm has better performance and higher accuracy than previous works.  

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

انتخاب استراتژی بهینه با استفاده از ترکیب تکنیک‌هایSWOT و FANP

بقا و حیات یک سازمان منوط به تصمیم‌گیری صحیح در مواجه با فرصت‌ها و تهدیدات موجود در محیط بیرونی سازمان می‌باشد. ازآنجایی‌که هیچ سازمانی نمی‌تواند منابع نامحدود داشته باشد استراتژیست ها باید در این مورد که کدام‌یک از استراتژی‌های مختلف می‌توانند بیشترین منفعت را به سازمان برسانند، تصمیم‌گیری نمایند. از طرفی تحلیل SWOT مدیران را قادر به کشف و شناسایی عوامل داخلی و خارجی مؤثر بر استراتژی‌های سازما...

full text

انتخاب سبد سهام فازی با استفاده از الگوریتم هوشمند ترکیبی با در نظر گرفتن ریسک نامطلوب

مطالعات تجربی نشان می‌دهد بازده دارایی‌ها نرمال و متقارن نمی‌باشد، بنابراین واریانس نمی‌تواند به‌درستی به‌عنوان معیار ریسک مناسب مورداستفاده قرار گیرد. در این پژوهش بازده دارایی‌ها به‌عنوان یک عدد فازی در نظر گرفته‌شده است و از معیار ریسک نامطلوب، نیمه واریانس و نیمه قدر مطلق انحراف از میانگین به‌عنوان معیار ریسک استفاده‌شده است. در ادامه به‌منظور حل مدل‌های مذکور از دو روش هوشمند ترکیبی بر مبن...

full text

انتخاب دید جهت ذخیره‌سازی دید در پایگاه داده تحلیلی با استفاده از الگوریتم فرهنگی ترکیبی

پایگاه داده تحلیلی حجم زیادی از داده‌ها که در سیستم‌های تصمیم‌گیرنده و گزارش‌گیر مورد استفاده قرار می‌گیرد را ذخیره می‌کند. در این سیستم‌ها سرعت پاسخ‌گویی به پرس‌وجوها به علت حجم زیاد داده‌های ذخیره‌شده، پایین است. از آن‌جایی که این سیستم‌ها عموماً مورد استفاده مدیران ارشد در سازمان‌های مختلف هستند، درنتیجه افزایش سرعت در این سیستم‌ها حائز اهمیت است. یکی از روش‌های افزایش سرعت، ذخیره دیدها جهت پ...

full text

انتخاب بهینه وب سرویس‌های مکانی در ترکیب سرویس‌ها با استفاده از کیفیت سرویس مکانی

یکی از مسائل قابل توجه و پراهمیت در سامانه‌های اطلاعات مکانی تعامل پذیری است. با ظهور فن‌آوری وب سرویس‌ها و الگوی معماری سرویس‌گرا در سامانه‌های اطلاعات مکانی، اشتراک داده‌های مکانی از روش کلاسیک و داده مبنا به روش توزیع پذیر و سست پیوند تبدیل شد. با افزایش درخواست کاربران برای اطلاعات مکانی، سازمان‌ها و افراد زیادی با توجه به استانداردهای اطلاعات مکانی (استاندارد OGC)، سرویس‌های مکانی خود را ا...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 15  issue 4

pages  17- 30

publication date 2019-03

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023